#Figure CEO
Figure CEO 2026年首次深度訪談:美國最終只剩3家人形公司,26年夏季開始不依靠中國供應鏈!
Figure公司首席執行長Brett Adcock宣佈,手工編寫機器人程序的時代正式結束。在Peter Diamandis的Moonshots播客節目中,Adcock接受了一次內容廣泛的採訪。他透露,隨著Helix 02的發佈,Figure公司已經達到了“軟體2.0”的里程碑。Helix 02是一種人工智慧架構,它使得Figure公司能夠從其機器人程序中刪除最後109,504行手工編寫的C++程式碼。此次採訪在 Figure 公司位於桑尼維爾的總部進行,讓我們得以最詳細地瞭解該公司的“系統 0、1、2”核心及其 2026 年雄心勃勃的製造路線圖。核心內容總結刪除“笨拙”的過去。此次發佈的核心是Helix 02的全面部署,Adcock將其描述為機器人智能的根本性重構。之前的版本依賴C++來實現下肢控制和平衡,而Helix 02引入了System 0 (S0) ——一個全身強化學習控製器,它完全通過神經網路來處理平衡、接觸和協調。“如果只靠程式碼啟髮式演算法,我們根本不可能做到今天你所看到的四分之一,”阿德科克告訴迪亞曼迪斯,他指的是Figure 03 中機器人將玻璃器皿放入洗碗機的演示。這種“像素到扭矩”的方法使機器人能夠實現“房間級自主控制”,使其能夠像一個連續的系統一樣導航和操作物體,而不會像傳統控製器那樣出現“走走停停”的延遲。Figure 03:為該模型建構的硬體。Adcock 將Figure 03展示為一款專為運行 Helix 堆疊而設計的“主力機”。該硬體在經濟效益方面實現了巨大飛躍,Adcock 聲稱其製造成本比 Figure 02 降低了 90%。主要改進包括:重量減輕: F.03 比其前身輕了 30 磅,提高了安全性和動力效率。感測器整合:新型掌部攝影機和指尖觸覺感測器(靈敏度低至 3 克)現在直接融合到神經策略中。運動方式:全新的“被動式腳趾”設計可實現更自然的步態和更深的運動範圍,克服了早期型號“笨拙”的平足行走方式。此次硬體成熟是在Figure 02 測試機退役之後實現的,該測試機在寶馬生產線上累計運行了 1250 小時。Adcock 指出,雖然寶馬的試點項目取得了成功,但其底層架構“過於粗放”,無法擴展到 Figure 設想的數百萬台裝置規模。HARK 和“全能模型”願景。阿德科克討論了HARK的創立,這是一個專注於數字和物理自主性的全新人工智慧實驗室。HARK似乎是Figure向“全能模型”(一種能夠同時處理語音、推理和物理動作的單一神經網路)轉型背後的驅動力。阿德科克利用實驗室的進展解釋了Figure為何在2025年終止與OpenAI的合作關係。 “我們的團隊遠遠領先於他們,”阿德科克說道,他認為通用機器人需要一種純粹的大型語言模型(LLM)無法達到的“具身物理學”水平。他貶低目前的LLM,稱其為“高級Google搜尋引擎”,缺乏必要的世界觀,無法避免撞穿玻璃牆或壓壞易碎物品。2026年:機器人建造機器人。2026年的時間表依然十分緊迫。Adcock預計今年將在Figure的“BotQ”生產線上引入機器人,朝著“自我複製”的生產模式邁進。BotQ工廠目前正在進行改造,以支援每年近5萬台產品的產能。雖然與 Sunday Robotics 的“洗碗機大戰”凸顯了 Figure 處理易碎玻璃器皿的能力,但最終的考驗仍然是家庭環境。Adcock 坦言,儘管他2026 年的路線圖目標是“未曾涉足”的家庭環境,但當機器人出現在他自己的孩子身邊時,他仍然會“照看”它。“我們的目標是讓機器人能夠完全自主地在家中運行,照顧我的所有孩子,”阿德科克說。“只有當我覺得足夠安全,可以讓它自由活動時,它才適合所有人使用。”他估計,到2026年底,具備外科手術般靈巧度的硬體將準備就緒,但要達到同樣的可靠性水平,“大腦”還需要更多的資料。全球競賽。談到與中國的競爭,阿德科克既表示讚賞,又不以為然。他承認中國的職業精神和人才素質,但認為大多數國際競爭對手仍然停留在“開環”模式——預先設定的程序或遠端操作,他戲稱之為“豆漿玩意兒”。“給我展示一分鐘機器人完整、閉環、即時地完成任務的視訊,”阿德科克挑釁道。“你肯定在其他地方沒見過這樣的視訊。”特斯拉首席執行長埃隆·馬斯克最近提出了截然不同的看法,他完全否定了Figure公司以及整個美國機器人行業。在特斯拉2025年第四季度財報網路直播中,馬斯克表示:“據我們所知,在中國以外,我們沒有看到任何重要的競爭對手。”Figure 計畫到 2026 年夏季,使其供應鏈中幾乎沒有中國零部件,從而進一步保護這家估值390億美元的初創公司免受地緣政治摩擦的影響,同時努力交付首批真正通用的人形機器人得了來之不易的重大成果。以下內容為視訊初步實錄(未作精校,僅作參考)第一章:開篇與Figure機器人的進化史Peter Diamandis:你們取得的成就讓我震驚。現在你們用神經網路能做到的事情,每年都讓我大開眼界,整個業務面貌看起來完全不同。令人驚嘆的是,隨著你們積累資料,這些資料正成為驚人的進入壁壘和資產。Brett Adcock:這裡重要的一點是,一旦一個機器人學會了如何做某項任務,整個機器人編隊就都知道了,而人類並不是這樣運作的。我們何時能看到機器人製造機器人?我們將把機器人投放到我們的Baku生產線上。這將會是世界上最大的經濟體,這是一個超級有影響力的業務,將為所有人帶來無處不在的商品和服務,進入富足時代。這也是一個超級有趣的業務,就像在建構我們都想要的科幻未來。世界上每個主要團隊都會進入這個領域,你別無選擇。Peter Diamandis:各位好,Dave和我現在在聖何塞的Figure總部。我們剛和朋友Brett Adcock錄完播客,非常精彩。快看,我們就在這裡。這是Figure 01,最初的原型,雖然有點原始但仍能運作。它運行了第一個大語言模型和神經網路。Brett實際上是親手組裝這些東西的,當時全是為了收集遙測資料來建構後續版本。Peter Diamandis: 這裡是Figure 02,更美觀、功能更強,全面運行神經網路,拋棄了所有的C++程式碼。然後我們看到了Figure 03,這是目前的主力機型。我們剛才參觀時,大概看到有一百台這樣的機器人在走廊裡走動、在測試台上運行、在洗碗。太驚人了。Brett Adcock: 確實。Figure 03增加了一個靈活的腳趾,這讓它可以蹲下,而之前的腳部設計很笨重。Figure 03還配備了手掌攝影機。我們把重量減輕了約30磅,製造成本降低了90%。這是我們和Figure 03之間的完美高度差。Peter Diamandis :歡迎來到Moonshots節目。我和Brett Adcock在Figure總部,旁邊是Figure 02。距離我們上次一起做節目已經過去大約18個月了。我對你們的進展感到震驚。在AI時代,18個月就像十年一樣。Brett Adcock :歡迎來到Figure總部。我們剛剛參觀了這裡,我們有30萬平方英呎的空間,還有40萬平方英呎在開發中。你們看到Figure 03在走廊裡走動,全自動機器人運行著Helix 2系統。我今天剛收到Helix 2發佈的通知。我們看到機器人在做廚房任務、搬運包裹、製造零件。我們至少看到了一百台機器人。第二章:神經網路革命與程式碼的終結Peter Diamandis :我依然記得Figure 01把Keurig膠囊放入咖啡機的場景,那是個大事件,因為那是用神經網路而非C++完成的。對我們來說,那是一個巨大的轉折點。Brett Adcock :我認為我們需要解決幾個關鍵問題。第一,你能否製造出低成本、能力接近人類的電動人形機器人?這是硬體方面。第二,你能否找到一種方法,不靠寫程式碼來解決問題?如何使用神經網路來學習那些人類的行為表徵和新任務?當我們做Keurig任務時,那是第一個在人形機器人上運行的雙臂神經網路實例。那一刻我們就決定:“好了,我們必須全力投入神經網路。”整個技術堆疊都需要是神經網路。今天你們看到了Helix 2,這是我們迄今為止最棒的版本。Peter Diamandis :我們看到了Figure 03在全自動模式下運行Helix 2,把東西放進洗碗機,完全沒有預程式設計。我喜歡它展現出的人性化元素,比如用臀部關門,用腳頂起洗碗機。Brett Adcock: 這就是神經網路的不同之處。你會得到意想不到的行為,有些是你永遠無法通過編碼寫出來的。如果是寫C++程式碼,你只能走到死胡同。相比程式碼,神經網路能做的事情讓我大吃一驚。如果是寫程式碼,我們連今天展示的四分之一都做不到。Peter Diamandis :令人驚嘆的是,資料成為了不可思議的壁壘。如果你用C++寫這些,你投入了數億美元,你會不敢動它。而在神經網路中,你可以說:“嘿夥計們,從頭開始重新訓練。”這是一種完全不同的範式。Brett Adcock: 確實。大概一兩年前,我們有幾十萬行C++手寫程式碼。寫這些程式碼很貴,很難測試。我們在Helix 1中刪除了大部分程式碼,但下半身控制仍是C++。就在今天,我們刪除了剩餘的10.9萬行C++程式碼。現在全是神經網路了。這是全機身的神經網路。我們花了大概一年時間重構Helix架構來實現這一點。現在,機器人能像人類一樣在空間中移動,協調手眼腳,並在幾百赫茲的頻率下輸出扭矩。第三章:與OpenAI的分手及物理世界的挑戰Peter Diamandis:起初你們和OpenAI在軟體上有合作,後來分道揚鑣了。能談談這個嗎?Brett Adcock:我遇到了Sam Altman和OpenAI團隊,他們很有興趣進入機器人領域。他們確實想建立非常緊密的合作關係。他們和微軟一起領投了我們的B輪融資。我們開始合作開發下一代人形機器人模型。我們非常看重如何用語言來調節整個技術堆疊。大語言模型(LLM)在很多方面就像一個世界模型,它在權重中理解什麼是事物,應該做什麼。但這種合作並沒有奏效。我們的團隊在幾乎一年的時間裡表現得比他們更好。我們在內部自己做所有的工作,我們有來自世界頂尖實驗室的人才。教別人如何為嵌入式系統建構AI模型變得沒有意義,所以我們決定自己做。Peter Diamandis :LLM是基於文字資料建構的,它有常識,但如果你把它安裝在物理機器裡,它並不知道自己在做什麼。你必須接觸世界。機器人有40多個自由度,狀態空間比宇宙中的原子還多,所以你無法一一模擬。Brett Adcock: 確實。我需要理解精細的接觸動力學。比如抓這個水瓶,我該如何定位手肘、骨盆、軀幹?LLM雖然覺得自己知道,但往往會完全失敗。我們嘗試過把LLM直接放在機器人裡進行“零樣本”(Zero-shot)測試,結果它確實能以正確的方向走,但直接撞上了一堵透明玻璃牆。它缺少對物理世界的理解。我們在Figure不僅要解決這個問題,我還成立了一個新的AI實驗室叫HARC,專注於這種物理與數字結合的AI。第四章:中美競爭、遠端操控與全自動的真相Peter Diamandis :關於中國,今年有報導稱中國有150多家機器人公司,出現了“機器人泡沫”。而在美國,嚴肅的玩家可能不到10家。你認為未來會發生什麼?會像汽車行業那樣整合嗎?Brett Adcock :這在每個深科技行業都會發生。最終全球會整合為少數幾家集團,遠少於10家。在美國可能只有兩三家。製造硬體很難,要讓神經網路在上面運行並規模化更難。我認為大家低估了其中的難度。Peter Diamandis: 我想知道人們是否意識到,很多機器人視訊其實是遠端操控(Teleoperation)的,而不是全自動。而我們剛才看到的是Helix 2進行了4分鐘的全自動操作,完全沒有預程式設計。Brett Adcock :我這輩子沒見過這麼多公司,背後藏著個人操控機器人,然後發視訊假裝是自動的。這就像我說我有自動駕駛公司,其實有個人在遠端開車。如果你想做對,必須全端相信神經網路。令人印象深刻的不是製造或遠端操控。你可以用很爛的硬體進行遠端操控。難的是在未見過的場景中進行端到端的神經網路控制,並實現數小時甚至數天的長時程工作。如果我們能解決通用機器人問題,那怕只有10台機器人能進入未知環境做真實工作,這才是區別所在。我們目前還處於“誰能解決通用機器人”的階段。Brett Adcock :那些功夫表演的視訊,本質上是你在讓人穿上動捕服做動作,然後讓機器人盲目重放(Open Loop)。這很容易,任何大學生都能做到。你真正想要的是閉環控制(Closed Loop),機器人能以每秒200次的速度推理並動態響應環境。這比開環重放要難上十萬倍、一百萬倍。第五章:Helix 2 架構與2026年展望Peter Diamandis :那麼2026年有什麼值得期待的?Helix 2的定義是什麼?Brett Adcock :Helix 2是一個巨大的飛躍。首先,我們在機器人內部整合了一個完全學習的控製器,我們稱之為System Zero。機器人體內沒有任何程式碼,它使用全機身強化學習控製器來移動。據我所知,還沒人能將其整合進全機身進行學習型操控和感知。其次,我們根據在寶馬工廠的經驗重構了架構。我們意識到之前的架構無法擴展到10萬台機器人。Helix 2是專為大規模預訓練資料設計的,而Figure 03則是專為運行Helix 2設計的。這是一個圍繞資料設計的閉環。Peter Diamandis:2026年你最大膽的預測是什麼?Brett Adcock :第一,我們將把機器人放到Baku生產線上,今年就開始讓機器人製造機器人。第二,我們要在工業和商業勞動力中規模化部署Figure 03。我們已經簽了多個客戶,明確了部署計畫。我們更傾向於租賃模式,就像人類也是被“租賃”的一樣(工資)。第三,也是最重要的,我們要解決通用機器人技術。我的願景是建構一個穿著緊身衣的“人類”,你可以和它交談,它有常識推理能力,有完美的記憶,可以成為你的伴侶。Peter Diamandis :是否會有兩個不同的模型?一個負責身體和物理的VLM,一個負責對話的大語言模型?Brett Adcock :我們相信最終會歸結為一個“Omni Model”(全能模型)。它在預訓練早期就將所有這些融合在一起。我們需要語音、語言調節策略、物理理解、記憶和個性。這不僅僅是完成任務,我們希望機器人能理解你的情緒。另外,我們現在只有一個神經網路,並沒有針對“洗碗”或“物流”的獨立網路庫。第六章:硬體、算力與供應鏈深度解析Brett Adcock :我們發現,即使有更多資訊輸入,比如學會彈鋼琴能讓你成為一個稍好的足球運動員一樣,資料會產生正向遷移。在Figure,我們試圖建立世界最好的模型。對人形機器人來說,多樣性至關重要。Peter Diamandis :你們使用常規GPU進行訓練,但推理(Inference)時的計算是在專用的、非H100的硬體上運行的,這成本可能便宜100倍。Brett Adcock :是的,而且它是完全在機器人板載運行的。我們可以進行非常快速的推理和策略部署,也不會消耗掉機器人所有的電力。我們主要關注供應鏈、電池和通訊。在通訊方面,我們在機器人上配備了Wi-Fi、5G和eSIM卡,所以即便沒有Wi-Fi,你也可以給機器人發簡訊。它還有藍牙。理想情況下,你希望隨時保持連接,但也希望機器人在斷網時仍能執行任務。Peter Diamandis :說到電池,現在的電池續航如何?順便說一句,我喜歡那種通過腳部無線充電的設計。Brett Adcock :目前單次充滿電可以運行大約4到5個小時。我們通過腳部進行感應式無線充電,功率約2千瓦。電池組容量大約是2千瓦時,所以充滿電大約需要一小時。這意味著它可以工作四五個小時,休息一小時充電。這很棒。我認為人們過於關注單次充電能跑多久了。並沒有多少任務需要連續工作幾小時而不休息。它可以進行機會性充電,比如在廚房水槽前鋪一塊充電墊,它在洗碗時就能充電。Peter Diamandis :人們確實在過度關注一些奇怪的指標,比如“它能跑多快”、“能做後空翻嗎”。Brett Adcock :你說的大部分都是開環(Open Loop)行為,也就是重放預設動作。而在Figure,我們需要看到的是真正的閉環控制:機器人像人類一樣移動、觸摸、搬運物體。這才是最難的問題所在。我們看到人形機器人領域出現了爆發式增長,但在達到“真實閉環控制”這一點上,出現極其陡峭的滑坡。你很少看到機器人能連續一分鍾不剪輯、不遠端操控地做家務。我們花了兩年時間,每周工作7天,才從幾分鐘的桌面操作發展到如今的全屋自主。Peter Diamandis :既然你選擇了垂直整合,目前的供應鏈有多少還依賴中國?Brett Adcock: 我想大概到今年夏天,我們的供應鏈裡幾乎就不會有中國的部分了。但我其實很喜歡中國,我在那裡待過很長時間。在美國看電視你會覺得那是巨大的衝突和戰爭,但當你真正去到中國,你會發現那裡的創業精神令人驚嘆。每個人都想贏,但也想合作,感覺就像在一個巨大的創業孵化器裡。Peter Diamandis :你們自己製造執行器和電機,我記得你提到Figure 02到Figure 03的成本降低了90%,這是驚人的。Brett Adcock: 我們進行垂直整合是因為迫不得已。如果能直接買到合適的電機或靈巧手裝上去,那是極好的,但這行不通。如果你不親自做工程設計,一旦某個環節出問題,你就完了。現成技術的成熟度太低了。早期我們也嘗試過外購,但基本都失敗了,所以只能自己設計。現在我們自己做總裝,一方面是因為沒人知道怎麼做更好,另一方面也是為了保護IP。Brett Adcock :即使我們使用現有的供應鏈,機器人也做不到你們今天看到的事情。如果你現在去買一個現成的人形機器人,它沒有合適的感測器,沒有足夠的算力,散熱不行,硬體不是圍繞神經網路棧建構的。很多從中國買機器人的團隊,最後都得自己改裝,背個大背包放電池和算力,但這無法規模化。這就像搞火箭卻想買現成的火箭一樣,行不通。Peter Diamandis: 看著像Unitree(宇樹科技)、Engine AI等中國公司,你最關注那一家?Brett Adcock :中國確實爆發出了很多優秀的人才和機器人。但我認為我們還沒看到這些系統展現出任何閉環AI控制能力。他們大多是在賣硬體,或者做大量的開環控制。這與設計全自動系統是完全正交的兩回事。如果要問Figure真正的競爭對手是誰,我認為主要就是“中國”這個整體。Peter Diamandis :這將會是世界上最大的經濟體,這是一個50兆美元的市場。Brett Adcock :沒錯,這大約占人類勞動GDP的一半。世界上每個主要科技集團都會進入這個領域,你別無選擇。但我認為這很難,因為我們正在做的是“火箭級”難度的設計。人形機器人的硬體工程難度可能堪比火箭設計。這可能是地球上最難的硬體之一。Peter Diamandis :現在有了Helix和巨大的神經網路,這是第七層能力嗎?還是它滲透到了其他層?Brett Adcock :在Archer,最高層的規劃是由飛行員完成的。而在Figure,隨著Helix 2的推出,現在完全是由神經網路來決定做什麼。誰來告訴技術堆疊該做什麼?這個“最高層行為”以前可能來自手把或開環指令碼,現在則來自神經網路的規劃和推理。第七章:家庭、AGI與未來願景Peter Diamandis :讓我們談談家庭應用。醫療保健和養老將是重要部分。你對這方面怎麼看?Brett Adcock: 我在中西部的一個農場長大,父母經營獨立輔助生活設施,所以我從小就接觸養老護理。我非常有激情去解決如何讓機器人進入養老護理,讓人們能居家養老。目前養老設施很難讓人願意搬進去,而且供不應求。Peter Diamandis :你認為AGI(通用人工智慧)需要具身實體嗎?Brett Adcock :當我今天使用AI時,我覺得它很笨,就像一個高級的Google搜尋引擎。我想建構的是Jarvis,我希望它能推理、有完美記憶、能接觸物理和數字世界。我的新實驗室HARC正在做這件事,我們讓AI從頭開始設計CAD圖紙,比如我讓它給我的兒子設計一個怪獸卡車,它在一小時內就能完成。目前的頂尖實驗室都在互相模仿,沒人真正建構能推理、有持久記憶並能接觸世界的多模態系統。我的AGI版本是:它能做人類能做的事,而不只是給我念搜尋結果。未來12到18個月將是我們見過的最大AI轉型期。Peter Diamandis: 機器人什麼時候能做手術?Brett Adcock :從硬體角度看,我認為2026年我們的硬體就能達到外科醫生的操作水平。如果你能通過遠端操控讓機器人做到,我們就能讓它學會。只要硬體允許,剩下的就是資料問題。第八章:設計哲學與為什麼是雙足雙臂Peter Diamandis:我的朋友Salim Ismail問,為什麼只有兩隻手?為什麼不讓機器人有四隻手或六隻手?Brett Adcock :我們的目標是做人類能做的事,並以最便宜、最輕便的方式實現。更輕意味著更安全,更便宜意味著可製造性和規模化。如果你開始增加額外的手臂,機器人會變重,成本變高,製造變難。而且在物流場景中,四隻手並不一定更快,因為空間有限。我們的執行器速度還有3到5倍的提升空間,目前的限制主要是軟體還不知道如何高速操作。Peter Diamandis :確實。如果你讓機器人快3到5倍,一旦出錯,代價會很高。特別是在家裡,要是踢到貓就不好了。Brett Adcock :沒錯。你想要一個成本在1萬到2萬美元的機器人,而不是5萬美元。成本主要取決於產量,所以你希望像造汽車一樣大規模製造標準化的機器人。第九章:規模化與十億級機器人市場Peter Diamandis :如果價格降到2萬美元,按租賃算大概是每天10美元,每小時40美分。你估計2035或2040年地球上會有多少機器人?Brett Adcock :每個人都應該擁有一個人形機器人來處理工作,商業領域可能還需要50到100億台。如果一切順利,我認為地球上可以有數百億台人形機器人。我們基本上是在製造一個廉價的、能24小時工作的“人類副本”。我希望在24個月內,所有的機器人都能由機器人製造。Peter Diamandis :如果展望24個月後的未來,需求量將是數十億台。這需要數兆美元的資金。你會讓世界再等5年,還是去籌集那1兆美元?Brett Adcock :融資市場是存在的,看看信用卡或汽車租賃市場就知道了。關鍵在於:第一,必須解決神經網路的規模化問題;第二,必須讓機器人參與製造機器人。如果我們今天能解決通用人形機器人技術,讓它能做你想做的一切,我覺得我們今天就能出貨10億台。Peter Diamandis: 這有點像《星際迷航》裡的創世計畫。你可以把一個盒子運到肯尼亞,打開盒子,它就開始利用當地資源製造Figure工廠,而所有的IP都通過聯邦學習傳回母艦。這能讓GDP增長100倍。第十章:安全、隱私與未來Peter Diamandis: 關於家庭中的安全和隱私,你怎麼看?之前有過智能音箱監聽使用者的訴訟。Brett Adcock :安全是讓機器人大規模進入家庭的首要問題。這裡有語義上的安全(如不打翻蠟燭),也有本質安全(不傷害人和寵物)。我們有一個完整的網路安全團隊在處理這些問題。如果能做到,它們會比人類更安全,就像自動駕駛汽車最終會比人類駕駛更安全一樣。我們有超人類的感知能力,360度視野,時刻線上。Peter Diamandis :網友問:你什麼時候會放心讓Figure抱你的新生兒?Brett Adcock :在Archer時我常說,直到我願意讓自己和家人坐上去,它才算足夠安全。對於Figure也是一樣。當我能把機器人全自動地放在家裡,並且放心它在孩子身邊時,那就是它準備好了。目前我們還沒有達到那個階段,但那是我們的目標。Peter Diamandis :我今天早上剛和Kathy Wood聊過,她也是你們的投資人。我在聖莫尼卡開車時,會和孩子們數Waymo(自動駕駛計程車)的數量。Brett Adcock :Google早在2005年就看到了這個願景,並堅持了16、17年。Waymo是一個了不起的產品,他們沒有動搖,最終做到了。這非常鼓舞人心。Peter Diamandis: 最後一個極客問題。我在達沃斯聽到大家說格陵蘭島的礦產無法開採,因為太冷了。如果有十億台機器人,我們能不能去格陵蘭島開採?Brett Adcock :我認為我們會先去格陵蘭島,然後再去小行星採礦。只要有更好的工程解決方案,加上無限的勞動力,我們一定能找到辦法。第十一章:Figure 03 實物導覽Brett Adcock :好的,這是Figure 01。我們在成立公司後一年內設計並讓它走了起來,這可能是歷史上最快的時間之一。雖然不漂亮,但它解鎖了我們的軟體開發。這是全鋁製結構,重約130-140磅。Brett Adcock :然後是Figure 03,這是我們的主力。我們讓機器人變得更瘦、質量更輕,但保持了同樣的速度和扭矩。它大約135磅(約61公斤),手部可以承重20公斤。這是一雙全新的手,指尖有觸覺感測器,覆蓋了柔軟的順應性材料。它是為了量產設計的,使用了軟性外殼,大大減少了夾傷點。我們大幅降低了成本,提升了散熱和計算系統。Peter Diamandis :為什麼選擇在臉上保留螢幕?Brett Adcock: 如果不小心,黑色的臉部可能會給人一種反烏托邦的感覺。我們有三個螢幕,可以顯示狀態,甚至播放Netflix。更重要的是,大腦(計算單元)就在頭部,這非常合理,便於散熱,也便於佈置攝影機和感測器。Peter Diamandis :這就是Figure在月球、在軌道、在海底的未來。我們很快會在太空中建立資料中心,需要有人去組裝它們。零重力環境將是絕佳的測試場。Brett Adcock: 百分之百。如果是那樣,我們可以帶它去飛零重力飛機測試。如果能在太空中運行,那將極其重要。我們也會去其他行星,這需要自動化。Peter Diamandis :今天的節目就到這裡,感謝大家收看Moonshots。 (人形機器人洞察研究)
Figure CEO 稱人形機器人已進入AGI 工程驗證期,四年部署10 萬台,並具備本地執行能力,手機之後的下一個通用平台
Figure 創辦人Brett Adcock 與工程負責人Scott Achorn 日前參加了Gemini 開發者關係負責人  Logan Kilpatrick 主持的對談,系統回顧了團隊在機器人軟硬體系統上的最新進展。Brett Adcock 先前創辦電動垂直起降飛行器公司Archer Aviation 與人才平台Vettery,具備工程執行與融資經驗;Scott Achorn 曾任Tesla Autopilot 工程負責人,主導核心安全系統與控制模組的設計。兩人共同推動Figure AI 從第一原理重建機器人平台,放棄傳統液壓方案,轉向全電驅動機電結構,並構建本地部署的神經控制系統Helix,在不到一年時間內,完成了具備穩定步態與操作能力的原型機迭代。Brett Adcock 表示,人形機器人正被視為AGI 的關鍵物理形態之一,其部署節奏已進入面向現實世界任務的工程化階段,而在物流、製造、醫療等高標準化行業,原型機器人已可穩定執行無需人工干預的流程任務。▍AGI 進入工程化驗證期人形機器人正進入面向現實世界任務的部署階段。在多個研發路徑中,其被認定為AGI 的重要承載形態之一。伴隨科技體系的完善,機器人進入家庭與公共場景的時間周期正在縮短。依照目前的硬體成熟度與控制系統能力,這類機器人已開始在部分試點場景中以較高密度部署,用於執行指定實體空間中的連續性任務。目前進展的基礎來自於機電系統的系統性改進。在過去數年內,一套以電力驅動為核心的機電平台逐步成型,並已在多個原型設備上實現穩定運作。該系統已通過內部與外部試點驗證,在安全性與任務連續性方面表現出與航太設備接近的穩定水平。與十年前以液壓驅動為主的系統相比,如今的全電結構在洩壓控制、維護難度與使用安全性方面已構成明顯分野,早期液壓系統因承壓不穩與洩漏風險而帶來的運行障礙已基本不再出現。與硬體系統同步演進的,是神經網路模型在機器人本地的部署能力。在此之前,機器人多數依賴預設路徑與規則庫進行動作規劃,難以適應實際作業中的動態變化。而目前系統中所使用的神經網路控制模型,已能在本地獨立完成多項連續動作指令的生成與執行。例如,在一段公開展示影片中,機器人設備在標準物流場景下連續完成60 分鐘揀選與轉運任務,控制過程完全依賴本地的S1 Helix 神經網路模型,未出現中斷或人為介入。該系統在動作節奏、路徑修正、物體辨識與回授響應等方面的穩定性,已超過傳統基於伺服邏輯的控制方案。在架構路徑的設定上,專案從一開始就排除了輪式移動平台與局部執行結構等形態,直接確立人形機器人為產品開發的核心方向。Figure 在成立初期即完成願景文檔,並以此為依據提交註冊與研發啟動流程。在產品設計上,團隊明確迴避了「過渡性方案」或最小功能單元的迭代策略,所有資源集中於完整人形結構的搭建與測試,直接推進系統的端到端建設資金來源方面,團隊依賴早期專案的資本累積與自籌路徑,自Figure 設立起即進入百萬美元等級的月度投入強度。工程啟動後五個月內,研發節奏加快,核心結構逐步成型,並於不到一年時間內完成首套具備自主步態能力的原型機器人系統。相關硬體總成、動作控制連結與本地運行模型皆由內部完成建置與調試。在目前以深科技為主導的投資周期中,該類專案的推進節奏已被資本接受,相關機構也逐步將其視為具備部署可行性的技術平台之一。在能力覆蓋範圍上,人形架構與傳統低維設備如掃地機器人或定向分類機械手臂存在本質差異。前者在運動自由度、負荷變化適應性及任務泛化能力上具備更高彈性,在特定場景下可取代多項原本由人工執行的操作流程。在核心能力達標後,這類系統開始在有限空間中承擔全天候連續作業任務,由早期演示轉入封閉環境內的階段性運行測試,逐步進入工程驗證階段。在最新的部署中,部分原型系統已實現長時間作業不中斷,系統開始具備任務軌跡穩定復現能力,透過連續運行累積可用於多場景遷移的回饋資料。在多輪迭代中,硬體與演算法的結合開始反映在實際執行效果上,機器人作為實體執行單元的特性在真實場景中逐步體現,產品的部署路徑也隨之向更大規模推進。▍硬體創業與市場採納雙重挑戰在從軟體轉向硬體的過程中,工程周期與資源投入的時間維度被大幅拉長。從產品策劃到系統集成,硬體開發周期受制於物理約束,既不可壓縮,也伴隨更高不確定性。硬體系統無法像程式碼模組一樣透過版本控製或遠端部署隨時更新,涉及零件採購、供應鏈建置、製程打樣與大量製造,每一環都需前置完成。一個在軟體中可在數天內部署的方案,在硬體體系中往往需要一年以上的驗證周期。專案組以完整系統建置為目標,需先建置生產所需的上下游關係網絡,並購買實體元件建置可運作的機械系統。在這個過程中,任何技術迭代都意味著高額成本,必須通過實體建模、組裝與調試後,才能驗證假設是否成立。硬體專案每一次技術迭代需付出高昂成本,驗證過程無法回退,整體更接近一種'重資產、不可逆'的產品演化路徑。此外,硬體產品在完成樣機階段後,還需面臨生產標準化與推廣連結的建置。複製路徑涉及從製程打樣到供應交付的完整製造鏈條,遠超軟體時代的版本迭代邏輯。尤其在人形機器人這類高複雜度產品中,其推廣路徑無法複製傳統SaaS 模型的成長邏輯,涉及設備安裝、場景適配、遠端運維等長期運作結構的建構。儘管如此,物理工程系統所帶來的直接回饋,也成為團隊最顯著的激勵來源之一。相較於在瀏覽器中點選操作的程式碼成果,實物的運作狀態、結構響應與動作精度提供了更具實體感的「完成度確認」。從團隊成員個人經驗來看,在完成軟體創業周期後,轉向硬體系統的開發反而帶來了更清晰的節奏感與工程確定性。只要目標方向明確,系統可依據既有物理法則進行建模與迭代,不再依賴對使用者偏好或市場回饋的持續試探。在市場路徑規劃上,Figure 採取平行推進的方式,分別探索家庭與職場兩類場景。前者高度非結構化,場景複雜度高;後者俱備標準化程度較高的環境特徵,部署門檻相對可控。儘管從想像空間看相比家庭場景的潛在使用頻率與覆蓋人群,企業客戶在結構清晰度與單位價值密度上更具現實部署優勢,家庭機器人似乎存在更廣闊的使用頻率與覆蓋人群,但在現實商業路徑上,企業用戶的付費能力、場景結構清晰度與單位價值密度都顯著優於消費側。目前產品以職場應用為主要部署場域,包括物流、製造、醫療、建築等具備重複性任務結構的產業。機器人硬體的尺寸、關節自由度與負載能力,已足以涵蓋部分替代人工操作的場景需求。在應用篩選邏輯上,團隊並未沿著「先發現應用,再尋找客戶」的路徑推進,而是透過分析不同產業鏈中的人工密集環節,主動選定若干高落地潛力的行業進行前置研究。其中,在與某家物流企業接觸過程中,團隊透過現場走訪發現其小型包裹分揀任務長期依賴人工完成,環節多、任務量大,且由於包裝尺寸、材質、堆疊方式各異,傳統規則式控制方案無法勝任。針對此結構問題,團隊建構了專用於此任務的神經網路學習系統,以實地作業資料驅動控制模型最佳化。機器人在幾天內完成訓練,達到平均每3.5 至4 秒處理一個包裹的穩定節奏,可實現條碼識別、姿態調整、路徑優化與主動規避等連續操作,展現出對非結構物體的動態處理能力。這項部署實踐成為目前系統能力的主要技術回饋來源之一。在硬體維度不斷完善的同時,控制系統能力的演進也被實地任務反哺,以建構「通用執行器」所需的長期學習架構。Figure 目前的策略是在職場高標準化環境中建立通用能力基線,並逐步建立不同任務之間的共享技能結構,使未來的機器人平台可在不同領域間實現知識遷移與任務泛化。家庭應用的進展仍在進行,但因場景異質性極高、使用者需求變化頻繁,短期內仍需更多樣本支援與測試閉環。階段性策略明確以職場部署為能力基線,家庭路徑仍處探索期,預計數年內才具備規模化可能。▍四年內部署10 萬台設備在軟硬體能力相互促進的背景下,機器人系統的效能提升正逐步轉向以部署規模為基礎的學習體系驅動。Figure 目前的核心策略之一,是將大量設備投放到實際運行場景,透過物理交互累積操作經驗,並建構本地反饋迴路,這種基於現實任務的自我迭代機制,正在成為系統演化的主要路徑;此外,部署過程中收集的數據持續用於優化動作路徑與感知精度,部分模型還通過“軌跡軌跡復用”機制,在不同設備間共享的微調結果,構成一個與感知精度,部分模型還通過“軌跡軌跡復用”機制,在不同設備間共享微調結果,構成一個同步分佈的空間。相較於依賴中心伺服器集中建模的傳統方式,這種方法更強調現場學習與終端間橫向同步,從而在多點部署中形成遞進式的閉環系統,將此機制視為構建系統護城河的關鍵通道之一。製造能力也在同步擴展。新建的專用生產中心Baku 已啟動Figure 3 的量產流程,這代產品結構針對大量製造進行最佳化,硬體成本較前代下降約90%,為後續大規模部署提供前提保障。目前系統已在環境適應性、語音理解與自主運動等方面形成穩定性能,下一階段的主要瓶頸正轉向製造系統能否支撐百萬級產能輸出。 Figure 正探索借鏡消費性電子供應鏈的生產機制,在保證品質的前提下實現高頻製造。產品在功能指標上已逼近人類基礎操作能力,包括移動速度、負載穩定性與關節自由度等維度;當前目標是實現無需人工干預的連續作業能力,並透過多地部署收集性能樣本,以推動系統向大規模工程化遷移。在產品設計上,Figure 將外觀結​​構與互動機制視為系統能力的一部分。針對家庭與職場的差異環境,設計策略並未採用弱化存在感的方向,而是透過結構穩定性與控制精度建立信任,同時避免使用擬人化介面或動畫元素,防止使用者對能力產生誤解。而家庭部署面臨的主要困難包括環境異質性、路徑規劃複雜度、行為安全語意解析。為此,Figure 研發了具備360 度覆蓋範圍的視覺與感知系統,並在路徑決策中引入多層冗餘控制,以確保機器人在面對液體、火源等危險元素時具備預判與迴避能力。控制系統方面,目前架構已支援自然語言互動作為主入口,每台設備配備獨立eSIM 通訊模組,可接收遠端語音或文字指令,並透過本地語言模型解析任務目標,取代傳統按鈕或App 輸入。安全機制被視為系統底層組成。產品設定了一個不可覆蓋的本地行為權限區,禁止root 權限獲取,避免外部干預控制鏈路。同時,Figure 內部已組成專職的資安團隊,涵蓋產品安全、網路安全與權限管理三大模組,目標是建構覆蓋家庭與工業場景的長期信任系統。在路徑規劃上,Figure 判斷未來數年為部署能力擴張的關鍵窗口,目標是在四年內部署10 萬台設備,完成全國性與跨產業的系統落地。目前,Figure 已在多個試驗情境中進行部署,並透過實際任務適應不斷累積分散式調度、維運與學習機制的系統經驗。整個系統的長期建造方向集中在三條主線:一是跨任務遷移學習的效率提升;二是製造系統的規模彈性;三是人與機器人之間的任務協同機制。在多個封閉場景中,機器人已實現近乎獨立的流程執行。目前研發重心正在縮小人工介入比重,增強任務分工連續性,為百萬級部署提前打通全鏈路能力。▍訓練機制演進與長期平台構想在機器人系統部署節奏加快的背景下,訓練機制正從靜態模型開發轉向基於實際操作資料的增量式最佳化。由於機器人屬於實體設備,其擴張路徑不同於軟體的複製邏輯,每一台都需在硬體層面完成組裝、調試與標定,真正的挑戰不在於製造能力,而在於是否能使每一台機器人在具體場景中實現有效運作、具備穩定執行價值。近期在物流場景中的實驗表明,團隊透過僅60 小時的新資料訓練Helix 控制系統,使原本未具備物流操作能力的機器人完成了連續分類任務。這驗證了局部資料驅動模型的快速適應能力,也成為目前訓練路徑策略的重要依據之一。Figure 設想,若能採集上億小時、甚至數十億小時的人類操作軌跡,模型的通用性將實現躍遷,支撐全球廣泛的部署。為實現上述路徑,模型壓縮與本地部署技術同步推進。視覺語言模型(VLM)已成為Helix 系統的核心元件,在產品端形成具備語意定位與指令映射能力的低延遲「大腦」模組。目前部署的S2 模型以每秒7–9Hz 的頻率運行,並與下層transformer 策略模組協同執行,確保本地高頻任務響應的即時性。在硬體限制條件下,此架構持續最佳化,在維持功耗控制與實體回饋準確性的同時,保障運算效能。然而,系統目前仍不具備對物體剛性、表面紋理、自身狀態等複雜物理屬性的完整理解,這些維度大多仍需透過工程手段手動嵌入。現實世界尚不存在可遷移的大規模標註資料來源,需建構一整套以實地互動為核心的訓練體系,以支援模型在多元物理環境下的泛化能力成長。目前公司約20% 的研發資源聚焦於Helix 訓練系統,專注於提升模型的學習速度與適應路徑,目標是建立具備自學習能力的控制架構,使機器人能在短時間內習得新任務並完成行為回傳,從而反饋修正統一基礎模型。同時,產品製造體係也持續演進。新製造設施Baku 已投入運行,作為Figure 3 的專用生產中心,完成了初步產線調試並啟動量產流程。該代產品在結構層面針對製造與運維流程優化,硬體成本相較前代下降約90%,為後續的大規模部署提供了前提。目前系統在環境適應性、語音理解與自主運動方面已具備穩定性能,下一階段的核心挑戰在於製造能力能否支撐百萬等級的部署需求。在產品平台日益完善的同時,Figure 也在思考系統部署後的社會結構演化趨勢。人形機器人在動作控制、穩定性與環境適配方面正逐步逼近可取代人類執行任務的臨界點。一旦進入規模化部署階段,「工作」本身的定義將被重構,重複性任務將被系統性地轉移至機器人平台,執行與否將更趨向個人選擇。在實際生產中,部分機器人已可完成自身零件的組裝任務,體現系統在工業閉環中的實用性與迭代基礎。圍繞著人類角色與時間結構的變遷,Figure 判斷,機器人平台將在經歷一段社會適配期後,與家庭、職場等基礎服務結構深度綁定,成為運作機制中的標準化節點。長期來看,Figure 正將機器人平台建構成可參與社會服務調度的基礎設施。使用者可授權閒置設備被他人調用,執行基礎事務或有償任務,建構具備主動經濟參與屬性的共享網路。在此邏輯下,設備本體成本、能源與維運支出構成單位服務成本結構,而服務密度提升將壓縮邊際成本,推動區域內形成高效率服務供給網路。此外,系統互動性也在同步強化:使用者可配置機器人在語言互動中的風格偏好,並透過語音或文字指令提升控制彈性。 Figure 堅持非擬人化外觀設計,強調結構穩定性與功能透明性,以建立更清晰的使用者預期。在安全機制層面,系統已設定不可覆蓋的本地行為限制區,禁止取得root 權限,同時設立資訊安全團隊,涵蓋產品安全、網路防護與權限控制等領域。目前Figure 判斷未來四年為部署能力擴張的關鍵窗口,預計部署10 萬台機器人,而未來的成長路徑將圍繞製造體系擴展、資料採集效率提升與任務遷移能力增強三個支點,逐步推進至百萬級部署。Figure 的願景是建立一個硬體標準統一、任務差異由軟體定義、具備持續學習與跨場景調度能力的通用機器人系統,成為繼智慧型手機之後的下一個社會基礎平台。大廠下場、模型未穩,AI 創業家如何找到可驗證的市場機會?(有新Newin)